Critères numériques et temporels pour la détection de documents vitaux dans un flux

نویسندگان

  • Vincent Bouvier
  • Patrice Bellot
چکیده

This paper addresses to a classification challenge in a filtering task. We use different kind of features to depict vital documents and filter them out from the stream. A vital document has to be relevant for a particular entity and has to relate a new story about it. We introduce different features that uses time as well as entity profil to perform classification. We evaluate our method on framework from TREC KBA 2013 (Knowledge Base Acceleration). MOTS-CLÉS : Filtrage, modèle adaptatif, profil d’entité, Random Forest,

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A Method for Detecting Artificial Objects in Natural Environments

Résumé Dans cet article nous allons présenter une méthode pour la détection automatique d’objets artificiels dans des images numériques représentant des milieux naturels. Cette méthode est basée sur la distribution statistique des motifs de texture dans l’image. Cette distribution est calculée en utilisant la loi de Zipf. L’image est divisée en imagettes et la distribution de Zipf est calculée ...

متن کامل

Extraction non supervisée de motifs temporels, multidimensionnels et hétérogènes Application à la télésurveillance médicale à domicile

Résumé. Une méthode générique pour l’extraction non supervisée de motifs dans des séquences temporelles multidimensionnelles et hétérogènes est proposée, puis expérimentée pour l’identification des comportements récurrents d’une personne à domicile. L’objectif est de concevoir un système d’apprentissage des habitudes de vie, à partir des données de capteurs, pour la détection d’évolutions criti...

متن کامل

Extraction d'opinions appliquée à des critères

Résumé. Les technologies de l’information et le succès des services associés (e.g., blogs, forums,...) ont ouvert la voie à un mode d’expression massive d’opinions sur les sujets les plus variés. Récemment de nouvelles techniques de détection automatique d’opinions (opinion mining) ont fait leur apparition et via des analyses statistiques des avis exprimés tendent à dégager une tendance globale...

متن کامل

Optimisation des requêtes temporelles sur le web

La recherche d’informations pertinentes sur le web est considérée comme un nouveau besoin de la société de l’information. Les méthodes de traitement d’informations fondées sur les statistiques ne sont plus suffisantes pour répondre aux besoins des utilisateurs afin de manipuler (rechercher, traduire, résumer...) les informations sur le web. Un constat tend à s’imposer : introduire plus de séman...

متن کامل

Un outil de détection automatique de thèmes

Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014